2023年计算机行业专题报告:华为算力进展不断

您所在的位置:网站首页 算力 华为股票代码 2023年计算机行业专题报告:华为算力进展不断

2023年计算机行业专题报告:华为算力进展不断

2024-07-13 17:56:23| 来源: 网络整理| 查看: 265

一、昇腾计算:全栈 AI 基础设施及应用服务

2019 年的第四届华为全联接大会上,华为首次发布对计算产业的理解与战略,宣布以“一 云两翼双引擎”的布局全面进军计算产业。 双引擎:指鲲鹏和昇腾两大基础芯片族,构筑异构计算架构。其中鲲鹏代表通用计 算,昇腾代表 AI 加速能力。 两翼:指华为智能计算业务与智能数据与存储业务。1)在智能计算领域,华为面向 端、边、云场景,打造“鲲鹏+昇腾+x86+GPU”的多样性算力,发布全球训练最 快的 AI 训练集群 Atlas 900、AI 推理和训练卡 Atlas 300 和 AI 训练服务器 Atlas 800。 2)在智能数据与存储领域,华为融合存储、大数据、数据库、AI 能力,围绕数据 全生命周期给出技术和产品支撑。 一云:指华为云。通过全栈创新,提供安全可靠的混合云服务,成为生态伙伴的黑 土地,为世界提供普惠算力。

1.1 全栈 AI 计算基础设施、行业应用及服务

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI 计 算基础设施、行业应用及服务,包括系列处理器、系列硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI 计算框架、应用使能、开发工具链、管理运维 工具、行业应用及服务等全产业链。

昇腾计算的基础软硬件是产业的核心,也是 AI 计算能力的来源。华为作为昇腾计算产 业生态的一员,是基础软硬件系统的核心贡献者。

1)昇腾计算的硬件系统: 基于华为达芬奇内核的昇腾系列处理器等多样化 AI 算力。基于昇腾处理器的系列硬件产品,如嵌入式模组、板卡、小站、服务器、集群等。

2)昇腾计算的基础软件体系: 异构计算架构 CANN 及对应的驱动、运行时、加速库、编译器、调试调优工具、开 发工具链 MindStudio 和各种运维管理工具等,开放给广大的开发者和客户。 AI 计算框架,包括开源的 MindSpore,以及各种业界流行的框架,作为生态的有机 组成部分。同时,昇腾计算产业秉承开放的生态建设思路,支持各种计算框架对接。 围绕昇腾计算体系,诞生了大量优秀应用,如互联网推荐、自然语言处理、视频分 析、图像分类、目标识别、语音识别、机器人等各种场景;昇腾计算产业也拥抱各 种云服务场景,支持 laas,Paas,SaaS 等多种云服务模式;同时,端边云协同的能 力推动昇腾计算成为全场景的 AI 基础设施。

1.2 自有+合作硬件体系,提供澎湃算力底座

昇腾(HUAWEI Ascend)310 是一款高能效、灵活可编程的人工智能处理器,在典型 配置下,半精度(FP16)算力达到 16 TFLOPS,整数精度(INT8)算力达到 8 TOPS, 功耗仅为 8W。采用自研华为达芬奇架构,集成丰富的计算单元,提高 AI 计算完备度和 效率,进而扩展该芯片的适用性。全 AI 业务流程加速,大幅提高 AI 全系统的性能,有 效降低部署成本。 昇腾(HUAWEI Ascend)910 是业界算力最强的 AI 处理器,基于自研华为达芬奇架 构 3D Cube 技术,实现业界最佳 AI 性能与能效,架构灵活伸缩,支持云边端全栈全场 景应用。算力方面,昇腾 910 完全达到设计规格,半精度(FP16)算力达到 320 TFLOPS, 整数精度(INT8)算力达到 640 TOPS,功耗 310W。

昇腾 910 性能可对标英伟达 A100。从主流 GPGPU/ASIC 产品算力看,昇腾 910 在整型 算力(INT8)可基本对标英伟达 A100 PCIe 80GB 产品。

基于昇腾 910 和 310 AI 处理器,昇腾计算产业在硬件方面坚持“硬件开放”策略,通过 自有硬件和合作硬件相结合的方式为客户提供多样化选择。

自有硬件:Atlas 系列硬件产品基于昇腾处理器和业界主流异构计算部件,通过模组、 板卡、小站、服务器、集群等丰富的产品形态,打造面向“云、边、端”的全场景 AI 基础设施方案,包括 Atlas 200 Al 加速模块、Atlas 200 DK AI 开发者套件、Atlas 300 Al 加速卡、Atlas 500 智能小站、Atlas 800 Al 服务器、Atlas 900 Al 集群等产品, 可广泛用于“平安城市、智能交通、智能医疗、智能零售、智能金融”等领域。

合作硬件:华为将 Atlas 系列硬件开放给合作伙伴,让伙伴基于 Atlas 系列硬件进行 集成和二次开发,联合打造有竞争力的产品。比如华为可以提供 Atlas 200 Al 加速 模块,合作伙伴集成后形成机器人、机器狗、输电智能巡检方案等 AI 系统;华为也 可以提供 Atlas 300 AI 加速卡,合作伙伴可以集成后形成 AI 服务器;华为也可以通 过 OEM/ODM 的方式使能伙伴开发自有品牌的服务器整机。

1)模组和板卡:昇腾计算提供模组、板卡两种类型,其中板卡根据使用场景分为推理 卡及训练卡。 Atlas 200 Al 加速模块(型号:3000):集成了昇腾推理处理器,半张信用卡大小即 可提供 22TOPS INT8 算力,可以在端侧实现人脸识别、图像分类等,广泛用于智能 摄像机、机器人、无人机等端侧 AI 场景。 Atlas 300I 推理卡(型号:3000/3010):基于昇腾推理处理器,单卡算力可达 88 TOPS INT8,目前可支持 80 路高清视频实时分析,是业界水平的 2 倍,可广泛应用于智 慧城市、智慧交通、智慧金融等场景。 Atlas 300T 训练卡(型号:9000):基于昇腾训练处理器,配合服务器,为数据中 心提供强劲算力的训练卡,单卡可提供 320 TFLOPS FP16 算力,加快深度学习训练 进程。具有高计算密度、大内存、高带宽等优点,适用于通用服务器。满足运营商、 互联网、金融等需要 AI 训练以及高性能计算领域的算力需求。

2)智能小站:昇腾计算产业为客户和伙伴提供了基于昇腾推理处理器的智能小站 Atlas 500,具有超强计算性能、体积小、环境适应性强、易于维护和支持云边协同等特点, 可以在边缘环境广泛部署,满足在安防、交通、社区、园区、商场、超市等复杂环境区 域的应用需求。

3)服务器:昇腾计算提供了 Atlas 800 系列服务器和 Atlas 500 Pro 服务器。Atlas 800 推理服务器(型号:3000/3010):基于昇腾推理处理器和鲲鹏/Intel 处理 器平台,集 AI 推理、存储和网络于一体,可以容纳最大 8 张 AI 推理卡,提供最大 704 TOPS INT8 推理性能,可用于视频分析、OCR、精准营销、医疗影像分析等推 理服务。 Atlas 800 训练服务器(型号:9000/9010):基于昇腾训练处理器和鲲鹏或 Intel 处 理器平台,集成 8 颗昇腾训练处理器,提供 2.24P FLOPS FP16 高算力,可广泛应 用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探 等需要大算力的行业领域。 Atlas 500 Pro 智能边缘服务器(型号:3000):面向边缘应用,基于昇腾推理处理 器和鲲鹏处理器平台,集 AI 推理、存储和网络于一体,可以容纳最大 4 张 AI 推理 卡,提供 352 TOPS INT8 高 Al 推理性能,拥有 475mm 的短机箱,支持 600mm 的 短机柜,可以在边缘场景中广泛部署。

4)集群:Atlas 900 Al 集群由上万颗昇腾训练处理器构成,通过华为集群通信库和作业 调度平台,整合 HCCS、PCIe 4.0 和 100G RoCE 三种高速接口,充分释放昇腾训练处理 器的强大性能。其总算力达到 256P〜1024P FLOPS FP16,相当于 50 万台高性能 PC 的 计算能力,可以让研究人员更快的进行图像、语音的 AI 模型训练,让人类更高效的探索 宇宙奥秘、预测天气、勘探石油,加速自动驾驶的商用进程。

2023 年 7 月 6 日的昇腾人工智能产业高峰论坛上,华为宣布昇腾 AI 集群全面升级,集 群规模从最初的 4000 卡集群扩展至 16000 卡,是业界首个万卡 AI 集群,拥有更快的训 练速度和 30 天以上的稳定训练周期,十倍领先业界。

二、算力为基,乘风而行

2.1 华为盘古等 AI 大模型落地,算力需求高涨

ChatGPT 等大模型的出现使得人工智能的发展进一步加速,世界各国正在进入百模千 态时代,人工智能与千行万业的深度融合成为热点与焦点,加速行业智能化成为未来人 工智能发展的主旋律。 华为于 2021 年 4 月,正式对外发布华为云盘古大模型。盘古大模型达到千亿级参数, 相对于以前的作坊式开发,AI 工业化开发效率可以大幅提升,同时 AI 模型具备更佳的 性能。 盘古大模型分为三层,L0 基础大模型,L1 行业大模型,L2 场景大模型。

L0 层是盘古的基础大模型,包括自然语言大模型(NLP)、视觉大模型(CV)、多模态 大模型、预测大模型、科学计算大模型,提供了满足行业场景的多种技能。

盘古 NLP 大模型:业界首个超千亿参数的中文预训练大模型,它利用大数据预训练、 对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。 在实现行业知识检索回答、文案生成、阅读理解等基础功能的同时,具备代码生成、 插件调用、模型调用等高阶特性,在智能客服、创意营销、会议助手、代码助手、 企业信息搜索等多个典型场景,提供 AI 技术支撑。

盘古 CV 大模型:基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型, 赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。

盘古多模态大模型:融合语言和视觉跨模态信息,实现图像生成、图像理解、3D 生 成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。

盘古预测大模型:面向结构化数据,基于神经网络 Transformer 架构,通过任务理 解、模型推荐、模型融合技术,构建通用的预测能力。典型客户案例包括山东能源 集团基于盘古预测大模型技术对生产数据的分析、建立洗选煤厂重介智能密控模型、 实现重介分选工艺在密度控制方面的智能预测和精准控制,以及兴盛优选利用盘古 预测大模型支撑不同门店、多种商品销量实时预测。

盘古科学计算大模型:面向气象、医药、水务、机械、航天航空等领域,融合 AI 数据建模和 AI 方程求解的方法,更快更准的解决科学计算问题。典型客户案例包括 旺山旺水基于盘古药物分子大模型的中枢系统创新药研发,微芯生物的肿瘤领域新 药研发,以及西交大第一附属医院的抗菌药研发。

L1 层是行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务, 金融,制造,矿山,气象等;也可以基于行业用户的自有数据,在盘古的 L0 和 L1 上, 为用户训练自己的专有大模型。 L2 层是为企业提供更多细化场景的模型,更加专注于某个具体的应用场景或特定业务, 为用户提供开箱即用的模型服务。 大模型发展下,算力需求有望迎来快速增长。仅考虑大模型训练成本,根据 Oneflow 的估算,GPT-3 单次训练成本约为 140 万美元;对于一些更大的 LLM 模型,训练成本单次 约达到 1120 万美元。依据如下:

1)基于参数数量和 token 数量,根据 OneFlow 估算,GPT-3 训练一次的成本约为 139.8 万美元: 每个 token 的训练成本通常约为 6N(而推理成本约为 2N),其中 N 是 LLM 的参数 数量。 假设在训练过程中,模型的 FLOPS 利用率为 46.2%,与在 TPU v4 芯片上进行训练 的 PaLM 模型(拥有 5400 亿参数)一致。

2)对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM), 采用同样的计算公式,可得出,训练成本介于 200 万美元至 1200 万美元之间。

2.2 华为智车再迎突破,自动驾驶算力有望持续激增

2023 年 9 月 12 日,AITO 问界新 M7 系列正式亮相,在智能驾驶、智能座舱等带来 全新体验。1)问界新 M7 搭载 HUAWEI ADS 2.0 高阶智能驾驶系统,率先实现不依赖于 高精地图的高速、城区高阶智能驾驶。HUAWEI ADS 2.0 高阶智能驾驶系统,在融合感 知 BEV(Bird Eye View 鸟瞰图)网络,识别白名单障碍物如车、人等物体基础上,升级 GOD 网络 2.0,拥有强大识别及处理能力,通用障碍物识别率达 99%,无需依赖在训练过程的数据标注。2)问界新 M7 智驾版配备 1 个激光雷达、3 个毫米波雷达、11 个高 清视觉感知摄像头及 12 个超声波雷达,实现动静态目标(含不规则物体)的全场景和 全天候感知。预计在 2023 年 12 月,城区智驾领航辅助可实现“全国都能开、越开越 好开”。

HUAWEI ADS 2.0 已于 2023 年 4 月首发,经 5 个月迭代,能力实现升级。 2023 年 4 月首发,多款车型搭载。2023 上海国际汽车工业展览会即将盛大开启, 华为于车展前夕首发 HUAWEI ADS 2.0。除问界 M7,HUAWEI ADS 2.0 也在 AITO 问界 M5 华为高阶智能驾驶版首发,阿维塔 11、极狐阿尔法 S・HI 版也有搭载。

持续迭代,“老练”程度不断提升。自 2023 年 4 月发布以来,HUAWEI ADS 2.0 在 AI 训练集群上构建了丰富的场景库,每天深度学习超过 1000 万 km,持续优化迭代 智能驾驶算法和场景策略。截至 2023 年 9 月数据,长距离 NCA 领航 MPI(Miles Per Intervention)高达 200km,城市高架汇入汇出成功率高达 99%。 国内乘用车自动驾驶正由 L2 向 L3+过渡。根据 36 氪研究院报告,得益于硬件平台和 软件算法逐步成熟,新车搭载 L2 功能正在逐渐成为前装标配。据统计,2022 年我国在 售新车 L2 和 L3 的渗透率分别为 35%和 9%,预计 2023 年将达到 51%和 20%。与此同 时,限定场景下商用车自动驾驶有望率先进入商业化阶段。原因在于:1)商用车价格敏 感度更低,B 端付费意愿更高;2)场景交通复杂程度较低及政策鼓励与放开等。

自动驾驶等级提升将同步提升算力需求。自动驾驶芯片一方面需要满足更高的安全等级, 同时随着自动驾驶级别的提升,需要更高的算力支持。根据前瞻产业研究院的报告,目 前 L2 级别的自动驾驶汽车需要 10 TOPS 左右的算力,L3 级别自动驾驶需 100 TOPS 左 右算力,而到 L4 级别后,自动驾驶汽车芯片算力需求将大幅度提升至 1000 TOPS 以上。 华为 MDC 平台赋能多级别自动驾驶场景,为目前已经量产、最大算力、最全系列的智 能驾驶计算平台。华为可提供 MDC 智能驾驶计算平台,主要包括基于昇腾 SoC 的硬件、 智能驾驶操作系统 AOS 和车控操作系统 VOS 及 AutoSAR 中间件,支持合作伙伴开发智 能驾驶软件。华为 MDC 采用“统一硬件架构,一套平台软件,系列化产品”的产品研发 规划是业内已经量产、最大算力、最全系列的专业智能驾驶计算平台。

华为自动驾驶云服务 Octopus 与智能驾驶计算平台 MDC、智能驾驶 OS 一起,发挥华 为云+AI 优势,共同组成车云协同的 MDC 智能驾驶平台。平台可提供华为自研昇腾 910 AI 芯片和 MindSpore AI 框架能大幅提升训练效率:在典型的 ResNet50 网络的训练中, 与现有友商的目前行业主流训练 GPU 相比,显示出接近 2 倍的训练速度提升,同时也支 持业界主流的深度学习框架如 TensorFlow 和 PyTorch。此外,在超强算力加持下,自动 数据挖掘功能结合预置丰富场景生成规则,还将为仿真提供更多有意义的场景,如接管, 前车插入和数据丢帧。

2.3 算力基建推进,华为 AI 集群落地各地智算中心

多地紧抓人工智能基础设施建设。随着算力需求高涨,多地政府都将人工智能基础设施 建设作为城市人工智能产业发展的重要抓手,为人工智能共性技术突破、中小企业良好 有序发展提供基础保障。近年,通过支持各地 AI 集群中心和华为云中心的建设,华为积 累了丰富的集群交付和部署经验,已经累计部署超千柜昇腾 AI 集群,是 AI 集群部署数 量最多的厂商。

截止 2023 年 7 月 6 日,昇腾 AI 集群已支撑全国 25 个城市的人工智能计算中心建设, 其中 15 个城市已经正式上线,6 个城市已经进行了至少一次扩容,武汉、西安、成都、 大连、北京等 7 个城市公共算力平台入选首批国家“新一代人工智能公共算力开放创新 平台”。

武汉人工智能计算中心:基于昇腾 AI 基础软硬件建设,于 2021 年 5 月 31 日正式 竣工并投入运营,上线即算力资源满负荷使用。于 2022 年 2 月 7 日完成首次扩容, 总算力达 200P,并再次饱和运营。目前,基于武汉人工智能计算中心,孵化了全球 全球首个三模态大模型一一紫东•太初,全球首个遥感影像智能解译专用框架——武汉.LuoJiaNet,业界最大遥感影像样本数据集——武汉.LuoJiaSet,并成立多模态人 工智能产业联盟和智能遥感开源生态联盟,为武汉孵化数百亿级智能遥感和多模态 产业(大于 300 亿)。2023 年 9 月 30 日,武汉人工智能计算中心顺利完成三期扩 容,算力总和达到 400P。

西安人工智能计算中心:西北首个大规模人工智能算力集群,于 2021 年 5 月正式 启动建设,同年 9 月 9 日正式上线运营,一期包含 AI 算力 300P、HPC 算力 8P。截 至 2022 年底,西安未来人工智能计算中心已与 170 多家企业合作,孵化了 150 多 个场景化解决方案,涵盖遥感、语音、文旅等方向。

中原人工智能计算中心:河南首家、全国继深圳和武汉之后第三家建成并投用的人 工智能算力中心,基于“黄河鲍鹏+昇腾技术”底座,是中原地区人工智能产业的 重大算力支持基础设施。项目总投资 10 亿元,占地约 14 亩,建筑面约 2400 平方 米,于 2021 年 10 月 21 日正式上线。一期建设规模为 100P AI 算力,相当于每秒 十亿亿次的计算速度,未来将达到 300P AI 的计算能力。截止到 2022 年底,该中 心服务中原企业客户 60 余家,高校学院客户 30 余家,科研单位 10 余家,同时还 有省外活跃客户百余家,平均算力使用率在 90%左右。

南京人工智能计算中心:基于南京市委市政府的产业规划,以及华为与江北新区共 建昇腾产业的合作协议,南京人工智能计算中心于 2022 年 5 月完成基础平台建设, 一期规划 40P(每秒计算 4 万万亿次)算力,上线即接近饱和,当前平均算力使用 率在 95%以上。截止到 2022 年 12 月,算力中心的应用已初具规模,已与 200 多 家合作伙伴推出超过 150 多个人工智能解决方案。

此外,昇腾 AI 集群的成功案例还包括 300P 算力、平均算力利用率 85%以上的成都智算 中心,二期扩容后总规模 140P 算力的杭州人工智能计算中心,总规划 400P 的沈阳人工 智能计算中心,总规划 300P 人工智能训练算力的天津人工智能计算中心,算力规模 400P的重庆人工智能计算中心等。未来,基于昇腾 AI 集群的公共算力服务平台将算力资源 有序、高效、普惠的开放给当地的企业、科研机构和高校,有效解决当地 AI 技术发展 和产业智能升级的算力和服务需求。

2.4 政策护航信创产业,自主可控进一步打开需求

外部环境错综复杂,全球产业链供应链面临重塑,应换尽换、真替真用共识进一步强化。 近年,美国对华先进计算和半导体的出口管制持续加码:

2022 年 10 月 7 日,美国商务部以维护国家安全为由,宣布了两项新的出口管制规 定,限制中国从美获得先进计算芯片、开发和维护超级计算机以及制造先进半导体 的能力。同时,通过再次修订 FDP 规则补增脚注 4 的方式,进一步扩大到 28 家实 体清单企业的限制范围,其中涉及包括华为、海光信息、景嘉微等企业。

在美国的推动下,日本、荷兰分别颁发对华出口管制。根据路透社报道,2023 年 3 月 31 日,日本宣布将限制 23 种类型的半导体制造设备的出口。根据彭博报道,2023 年 6 月 30 日,荷兰 ASML 对出口到中国的芯片设备实行新的限制(有关三种 ASML 机器的出货量),规则将从 9 月 1 日起影响一些 DUV 系统的销售。

在此国际大背景下,华为作为中国信创领域巨头,行业大单不断落地。近期华为相关中 标包括但不限于: 中国电信 AI 算力服务器(2023-2024 年)集采:据 2023 年 8 月 22 日财联社报道, 本次集采的产品品类包括 I 系列服务器以及 G 系列服务器,I 系列 CPU 采用 Intel 至 强可扩展处理器,G 系列 CPU 采用鲲鹏处理器。其中,I 系列规模为 2198 台,G 系 列规模为 1977 台,后者占比超过 47%。 上海银行 2023 年度 PC 服务器:2023 年 7 月 13 日,上海银行发布 2023 年度 PC 服务器(ARM 架构)入围选型项目公告,采购 ARM 架构核心系统 PC 服务器、外围 系统 PC 服务器。2023 年 9 月 9 日,中标结果公示,华鲲振宇、长江计算、神码云 科入围,皆为华为整机合作厂商。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭